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摘 要 场景 主旨 是 指 观察 者 在 一 次 注视 场景 的 过 程 中 所 获得 知觉 和 语义 信息 。 近 年 来 ， 场 景 主旨 加 工 研究 
已 经 成 为 视 知觉 领域 的 重要 内 容 ， 对 该 问题 的 研究 将 有 助 于 揭示 视觉 信息 加 工 的 机 制 ,对 智能 机 器 视觉 的 研 
制 也 有 一 定 的 借鉴 意义 。 对 场景 主旨 加 工 的 影响 因素 、 和 争议 性 的 问题 以 及 场景 主旨 的 神经 基础 进行 评论 ; 未 
来 可 以 在 场景 主旨 加 工 的 基本 单元 、 相 关 的 理论 解释 、 层 级 加 工 的 调节 因素 、 注 意 的 调节 作用 、 时 间 动 力 特 
性 和 脑 功 能 网 络 的 构建 等 方面 做 进一步 的 探讨 。 
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1 引言 Castelhano, & Henderson, 2006), i2S Aik, 尽管 
已 有 大 量 研究 证 实 了 人 类 视觉 系统 具有 加 工场 景 
主旨 的 超凡 能 力 , 但 关于 这 种 加 工 能 力 的 认 知 与 
神经 机 制 仍 处 于 探索 之 中 。 已 有 关于 场景 主旨 加 
工 的 研究 主要 涉及 以 下 五 个 方面 的 内 容 : (1) 场 景 
主旨 加 工 的 影响 因素 有 哪些 ” (2) 场 景 主 旨 的 层级 
加 工 优 先 性 问题 ， 即 在 场景 主旨 加 工 过 程 中 ,是 
上 级 水 平 (“自然 场景 > 和 “人 工场 景 *"、“ 室 内 ”和 “ 室 
2007; Friedman, 1979; #258, 2010; 见 综述 Oliva Dee eee Ee 
ar i , et , 道 " 和 “建筑 等) 场景 主 则 优先 得 到 加 工 ?”(3) 场 景 
2005; Oliva & Torralba, 2006)。 例如 ,我 们 可 以 将 一 区 ih gaa ce ae ee A 
幅 场 景 描述 为 < 海滩 ” “EMO”. ACEH 主旨 加 - -的 过 程 是 否 需 要 注意 资源 的 参与 ? (4) 场 
哪些 重要 的 理论 观点 ? (5) 场 景 主旨 


景 主旨 加 工 有 
4 场景 主导 BY 于 观察 AG Et = 
涉及 的 田 最 主旨 加 工 研 究 主要 指 现 察 者 在 较 短 时。 加 工 的 神经 生理 基础 ， 即 有 哪些 脑 区 参与 了 场景 
间 内 对 场景 刺激 进行 检测 、 再 认 或 分 类 的 研究 。 Sey ee ee ee 
场景 主 后 加 工 研究 可 以 追溯 到 上 个 世纪 六 七 = ee ieee 


的 加 工 ? 

AE ` . the ivan 42 -一 | 
We cance 场景 主旨 加 工 是 场景 知觉 研究 的 重要 内 容 ， 
事 进 行 了 开创 性 的 工作 ， 他 们 发 现 人 类 视觉 系统 a shin yt cies 
a beep ee E oa 有 其 重要 的 理论 意义 和 应 用 价值 。 一 方面 有 助 于 
能 够 迅速 提取 场景 的 主旨 信息 并 用 于 后 续 的 类 别 Oe ee: er 
Sik (Patan. 1975: Pollet k Lavy. 196). HiRes 增进 我 们 对 视觉 系统 加 工 机 制 的 理解 (如 ,Malcolm, 
se d a 和. 2 on T A one See E BOR LOTTE A Te wee 
° (Biederman, 19/2; te 4 Totralba, Oliva, 机 器 视觉 (如 , Wei, Phung, & Bouzerdoum, 2016), 

告 设计 (如 , Wedel & Pieters, 2015)、 安 全 检查 (如 ， 
收 稿 日 期 : 2017-02-28 Biggs & Mitroff, 2015) 和 医学 影像 诊断 (如 , Evans 
* 山东 省 自然 科学 基金 面 上 项 目 (ZR2017MC058); L Haygood, Cooper, Culpan, & Wolfe, 2016) 等 方面 
东 省 高 等 学 校 人 文 社 会 科学 研究 计划 项 目 J13WH07); 均 得 到 了 广泛 的 应 
山东 省 “泰山 学 者 海外 特聘 专家 ”项 目 (TSHW201502038); 
山东 省 高 校 人 类 认 知 与 行为 发 展 重点 实验 室 ; 山东 2 ”真实 场景 主旨 加 工 的 影响 因素 
师范 大 学 “二 层次 ”人 才 资 助 项 目 。 
通信 作者 : 任 衍 具 , E-mail: renyanju@gmail.com 


人 类 的 生存 离 不 开 对 周围 环境 的 感知 与 判断 ， 
因此 人 类 的 视觉 系统 进化 出 了 可 以 在 极 短 的 时 间 
内 获取 场景 中 的 必要 信息 ,并 进一步 对 其 做 出 类 
别 判断 的 能 力 (例如 : 这 是 一 幅 街道 的 景象 )。 场 景 
+E (scene gist， 也 称 scene schema) 被 界定 为 观 
察 者 在 单 次 注视 ( 数 百 毫秒 ) 场 景 的 过 程 中 所 获得 
的 知觉 和 语义 表征 (Fei-Fei, Iyer, Koch, & Perona, 
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We? 前 人 对 该 问题 进行 了 大 量 的 研究 ， 下 面 将 重 
点 介绍 颜色 、 空 间 频率 、 视 野 区 域 等 因素 在 场景 
主旨 加 工 中 的 作用 。 
21 颜色 

Gegenfurtner 和 Rieger (2000) 采 用 快速 呈现 - 
掩蔽 -再 认 范 式 ， 操纵 场景 图 片 呈 现 与 再 认 时 的 
颜色 信息 ,探讨 颜色 在 场景 编码 和 提取 加 工 中 的 


定 的 、 具 有 诊断 性 的 颜色 信息 ,那么 颜色 信息 对 
“城市 ?场景 的 主旨 加 工 则 没有 明显 的 影响 (Oliva 
& Schyns, 2000; Rousselet, Joubert, & Fabre- 
Thorpe, 2005)。 其 次 , 场景 图 像 本 身 是 否 清晰 也 会 
影响 场景 早期 阶段 加 工 对 颜色 信息 的 利用 程度 。 
有 研究 发 现 ， 颜色 信息 有 利于 模糊 广告 的 内 容 识 
别 ,但 当 广 告 图 片 变 得 清晰 时 ,彩色 广告 的 优势 


作用 ,结果 发 现 , 颜色 信息 既 能 够 为 早期 感觉 加 
工 的 编码 提供 线索 ,也 有 助 于 巩固 场景 图 片 的 记 
忆 表 征 (但 见 Yao & Einhauser, 2008), Goffaux 等 
人 (2005) 选 用 4 类 将 颜色 作为 诊断 性 特征 的 场景 
(沙漠 、 和 森林 、 峡 谷 、 海 岸 ), 经 过 处 理 获 得 3 种 颜 
色 类 型 的 场景 : 正常 颜色 场景 、 灰 色 场 景 和 异常 
颜色 场景 (将 原 场 景 中 的 颜色 进行 红 绿 置 换 和 蓝 
黄 置换 ); 要 求 被 试 完成 快速 场景 分 类 的 go/no-go 
任务 ， 结 果 发 现 视 觉 系统 对 正常 颜色 场景 的 分 类 
最 快 最 准确 ， 其 次 是 对 灰色 场景 的 分 类 成 绩 ， 而 
对 异常 颜色 场景 的 分 类 成 绩 最 差 。Castelhano 和 
Henderson (2008) 采 用 情境 偏向 范式 (contextual 
bias paradigm) 探 讨 颜 色 在 场景 主旨 加工 中 的 作用 ， 
先 向 被 试 呈现 场景 图 片 ， 接着 呈现 掩蔽 图 片 ， 掩 
蔽 图 片 过 后 呈现 物体 标签 (单词 )， 要 求 被 试 判 断 
该 标签 所 对 应 的 物体 与 场景 情境 是 否 一 致 。 其 实 
验 逻 辑 是 : 当场 景 图 片 的 呈现 时 间 足 够 长 时 ， 视 
觉 系 统 能 够 较为 充分 地 提取 场景 的 主旨 信息 ,被 
试 对 物体 与 场景 情境 是 否 一 致 的 判断 会 更 准确 ， 
在 二 者 一 致 的 情况 下 ， 就 会 出 现 “Yes” 比 “No” 多 
的 反应 偏向 效应 因此 一 旦 产生 了 此 类 反应 偏 癌 
效应 ， 则 意味 着 场景 主旨 在 呈现 的 时 间 内 得 到 了 
较为 充分 的 激活 。 结 果 发 现 ， 相同 反应 偏向 情况 
下 , 正常 颜色 场景 所 需要 的 呈现 时 间 明 显 短 于 黑 
白 场景 所 需要 的 呈现 时 间 。 由 此 可 见 ,， 正常 颜色 
场景 的 主旨 较 黑 白 场 景 的 主旨 激活 需要 的 时 间 更 


就 不 复 存 在 了 (Wedel & Pieters, 2015), BIE 
颜色 信息 在 场景 主旨 中 作用 存在 灵活 性 的 观点 
肯定 的 , 但 其 他 因素 所 产生 的 调节 作用 的 机 制 
需要 进一步 的 研究 。 
2.2 ”空间 频率 

人 类 的 视觉 系统 包含 多 个 对 不 同 空间 频率 信 
息 敏 感 的 通道 ,不 同 空间 频率 信息 在 面孔 、 物 体 
和 场景 分 类 中 有 着 不 同 的 作用 (Morrison & Schyns, 
2001)。Schyns 和 Oliva (1994) 为 了 探讨 视觉 系统 
在 分 类 场景 图 片 时 对 不 同 空间 频率 信息 的 选择 偏 
Ih], BR pik se OT BA (hybrid image, 将 
某 一 场景 图 片 的 低频 成 分 与 另 一 场景 图 片 的 高 频 
成 分 有 至 加 成 一 个 新 的 图 片 ) 的 分 类 任务 ,结果 发 现 
当 全 加 图 片 的 呈现 时 间 较 短 (30 ms) 时 ,被 试 更 偏 
向 于 使 用 其 低频 信息 进行 分 类 ， 而 当 呈 现时 间 较 
长 时 (150 ms) 时 ， 被 试 更 偏向 于 使 用 其 高 频 信息 
来 分 类 ; 他 们 由 此 提出 场景 主旨 的 早期 加 工 采 用 
的 是 “由 粗糙 到 精细 (coarse to fine, CtF)” 的 加 工 
模式 。 近 期 的 发 展 性 研究 表明 7~8 个 月 的 婴儿 
(Otsuka, Ichikawa, Kanazawa, Yamaguchi, & Spehar, 
2014) 和 18~22 岁 的 年 轻 人 (Musel, Chauvin, Guyader, 
Chokron, & Peyrin，2012) 均 存在 这 种 加 工 模式 ， 
而 且 这 种 加 工 也 存在 于 场景 选择 性 加 工 的 大 脑 区 
域 中 (Awasthi，Sowman，Friedman， 廊 Williams, 
2013; Musel et al., 2014)。 

需要 注意 的 是 ,场景 主旨 的 CtF 加 工 模式 


N tm 2 


少 ， 即 正常 颜色 信息 对 场景 主旨 的 加 工具 有 显著 


不 是 固定 的 , 会 受到 其 他 因素 的 调节 。 首先 , 任务 


的 促进 作用 。 

然而 , 也 有 研究 者 认为 颜色 信息 并 不 是 场景 
主旨 加 工 中 的 关键 因素 ， 它 所 产生 的 影响 会 受到 
其 他 因素 的 调节 (如 ，Marx，Hansen-Goos，Thrun， 
& Einhauser, 2014; Otsuka & Kawaguchi, 2009). 首 
先 ， 颜 色 信 息 的 诊断 性 会 影响 其 在 场景 主旨 加 工 
中 的 作用 。 例 如 ,在 “森林 ”场景 中 ,绿色 具有 较 高 
的 诊断 性 ， 因 此 绿色 对 场景 “森林 ”的 主旨 加 工具 
有 促进 作用 ; 而 在 ”城市 "场景 中 , 不 存在 一 种 固 


与 场景 材料 也 能 影响 视觉 系统 对 空间 频率 信息 加 
工 的 偏向 性 (Oliva & Schyns, 1997)。 例如 ， 当 使 用 
不 同 带宽 的 情境 信息 来 引导 被 试 进行 场景 中 的 物 
体 进行 快速 检测 时 ， 物 体 的 细节 信息 能 够 促使 视 
觉 系 统 利 用 高 频 情 境 信息 来 完成 任务 (Patai， 
Buckley, & Nobre, 2013); NAH PES IK 
的 信息 会 影响 视觉 系统 对 任务 相关 场景 信息 空间 
频率 的 反应 偏向 性 (Rotshtein, Schofield, Funes, & 
Humphreys, 2010)。 其 次 , 场景 分 类 过 程 中 视觉 系 
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统 对 空间 频率 信息 的 早期 加 工会 受到 注意 模式 的 
影响 (如 ，Vanmarcke & Wagemans，2016)。 近 期 ， 
Brand 和 Johnson (2014) 采 用 Navon 任务 操纵 被 试 
的 注意 模式 (注意 整体 /注意 局 部 )， 并 结合 场景 分 
类 任务 探讨 视觉 系统 对 空间 频率 信息 加 工 的 偏向 
性 是 否 会 受到 注意 模式 的 调节 ,结果 发 现 整体 性 
Navon 任务 的 启动 能 更 快 将 三 加 场景 归 类 为 其 低 
频 信 息 所 属 的 类 别 ， 当 低频 信息 受到 抑制 时 ， 分 
类 速度 有 所 减缓 。 总 而 言 之 , 空间 频率 对 场景 主 
旨 加 工 的 影响 具 定 的 灵活 性 , 但 这 种 灵活 性 
仅 表 现 为 对 粗糙 到 精细 加 工 过 程 的 促进 或 干扰 ， 
但 还 不 足以 打破 这 种 模式 的 时 间 发 展 顺序 。 

尽管 视觉 系统 对 真实 场景 中 不 同 空间 频率 信 
息 的 加 工 有 其 相对 固定 的 选择 偏向 , 但 大 脑 对 不 
同 空间 频率 信息 的 整合 是 非常 迅速 (在 100 ms 之 
内 即 可 完成 )， 且 整合 过 程 几乎 不 需要 注意 的 参与 
(Kihara & Takeda, 2010, 2012)。 神 经 科学 的 研究 
提出 了 快速 “M”* 假 设 , 该 假设 认为 ,大脑 皮层 中 
通过 大 细胞 通道 传输 信息 较 小 细胞 通道 更 快速 ， 
在 场景 主旨 加 工 过 程 中 ,低频 信息 通过 大 细胞 通 
道 首先 被 相关 脑 区 获取 并 形成 初级 表征 (Hagmann 
& Potter, 2016), 为 随后 小 细胞 通道 获得 其 他 细节 
言 息 提供 反馈 和 背景 框架 ， 启 动 自 上 而 下 的 促进 
作用 (Kveraga, Boshyan, & Bar, 2007; Maguire & 
Howe, 2016; Mu & Li, 2013; tH Jl Malcolm, 
Nuthmann, & Schyns, 2014; 但 见 Potter, Wyble, 
Hagmann, & McCourt，2014)， 也 可 用 于 后 期 高 频 
言 息 的 加 工 (Kaufftmann，Chauvin, Pichat, & Peyrin, 
2015; Kauffmann, Ramanoél, & Peyrin, 2014)。 快 
HMRI CtF 的 观点 提供 了 神经 基础 ， 但 目 
前 仍 缺 少 有 力 证 据 为 相关 脑 区 的 协作 运行 方式 做 
出 解释 ， 后 续 还 需 进一步 的 实验 验证 。 
2.3 ”视野 区 域 

人 眼 视野 根据 投影 从 中 心 到 边缘 可 以 分 为 中 
REK, MPRA, ShK, 三 个 区 域 对 外 
部 信息 的 分 辨 力 不 同 ,， 中 央 四 区 域 的 分 辨 力 最 高 ， 
其 次 是 副 中 央 四 区 域 , 外 周 区 域 的 分 辨 力 最 低 。 
这 种 差异 导致 了 不 同 视野 区 域 在 场景 主旨 识别 上 
的 作用 也 不 尽 相 同 ( 见 评论 Loschky, Nuthmann, 
Fortenbaugh, & Levi, 2017)。 值 得 一 提 的 是 知名 的 
视觉 研究 期 刊 Journal of Vision 在 2016 年 第 2 期 
专辑 论述 不 同 视野 区 域 在 场景 知觉 中 的 作用 


(http://jov.arvojournals.org/issues.aspx#issueid=934 


904)。 由 此 可 见 , 视野 区 域 是 近年 来 研究 者 所 关注 
的 一 个 重要 影响 因素 。 

最 初 的 研究 发 现 视觉 系统 仅 通过 外 周 视 野 所 
获取 的 低 分 辩 率 信息 即 可 完成 对 场景 主旨 的 判 
Wr. W, Larson 和 Loschky (2009) 采 用 ”窗口 
(window， 只 保留 场景 的 中 央视 野 信 息 ) A” E A 
(scotoma， 只 保留 场景 的 边缘 视野 信息 )” 范 式 ， 要 
求 被 试 完成 场景 -单词 匹配 任务 , 结果 发 现 利用 
边缘 视野 比 中 心 视野 完成 匹配 任务 的 正确 率 更 高 ， 
且 仅 利用 边缘 视野 与 利用 完整 视野 的 正确 率 无 显 
#5, Boucart, Moroni, Thibaut, Szaffarczyk 和 
Greene (2013) 发 现 观 察 者 在 场景 与 视野 中 央 离 心 
率 70? 的 情况 下 对 场景 主旨 进行 分 类 时 ， 可 以 达 
到 70% 左 右 的 正确 率 。 上 述 结论 在 Wang 和 
Cottrell (2016) 的 建 模 研究 中 也 得 到 了 证 实 。 这 些 
证 据 均 表明 外 周 视野 利用 低 分 辨 率 信息 能 够 完成 
场景 分 类 任务 。 

Larson 和 Loschky (2009) 认 为 这 可 能 是 由 于 
外 周 视 野 较 中 心 视野 的 面积 更 大 ,二 者 在 同一 
时 间 内 获取 的 信息 量 不 同 所 致 。 当 控制 二 者 的 面 
积 相 同时 ， 表 现 出 中 央视 野 的 加 工 优势 。 利 用 老 
年 黄斑 病变 (neovascular age related macular 
degeneration，AMD) 的 病人 进行 的 研究 也 得 到 了 
类 似 的 结果 ， 该 病症 会 引起 中 央视 野 的 缺失 ， 结 
果 发 现 无 论 场景 呈现 在 视 时 中心 还 是 外 周 , AMD 
病人 较 正 常人 对 主旨 分 类 的 灵敏 度 和 反应 时 均 降 
低 ， 且 这 种 降低 在 场景 刺激 出 现在 视野 中 央 时 更 
严重 (Thibaut, Tran, Szaffarczyk, & Boucart, 2014). 
这 表明 中 央视 野 在 场景 主旨 加 工 中 扮演 更 为 重要 
的 作用 。 

近期 ，Larson，Freeman，Ringer 和 Loschky 
(2014) 采 用 类 似 的 窗口 和 盲点 范式 , 对 场景 主旨 
早期 加 工 中 不 同 视野 区 域 作用 的 时 空 动态 进程 做 
了 探究 ,通过 控制 目标 场景 后 掩蔽 出 现 的 时 间 长 
度 来 操纵 场景 的 加 工时 间 。 结 果 发 现在 当场 景 的 
加 工时 间 为 24 ms 时 ， 中 央视 野 的 信息 对 基本 水 
平 场景 分 类 任务 正确 率 更 高 ; 而 增加 到 70 ms 时 ， 
中 央视 野 与 外 周 视野 对 基本 水 平 场景 分 类 任务 的 
正确 率 没有 显著 差异 。 表 明 在 早期 场景 主旨 加 工 
的 时 间 进 程 中 , 注意 首先 获取 中 央视 野 的 场景 信 
息 ， 随 后 注意 从 中 心 视野 扩展 至 边缘 视野 以 提取 
更 多 的 信息 。 

上 述 的 研究 结果 证 实 , 虽然 视觉 系统 仅仅 依 
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据 外 周 视野 的 信息 即 可 进行 场景 分 类 , 但 中 心 视 
野 在 场景 主旨 的 加 工 中 仍 具有 比 外 周 视 野 更 高 的 
效率 。 有 意思 的 是 ， 只 需 外 周 视野 足以 完成 场景 
主旨 分 类 任务 的 观点 ， 也 暗示 了 场景 主旨 分 类 不 
需要 集中 的 注意 资源 即 可 完成 , 这 与 注意 在 场景 
主旨 加 工 中 的 作用 的 部 分 观点 ( 见 本 文 第 三 部 分 
的 相关 内 容 ) 相 符 。 
24 其 他 因素 

除 颜色 信息 、 空 间 频 率 和 视野 区 域外 ， 场 景 
主旨 加 工 还 会 受到 场景 本 身 的 边界 (edge-based) 
(如 , Fu et al., 2016; Walther & Shen, 2014)、 振 幅 谱 
(amplitude spectra) (40, Hansen & Loschky, 2013; 
Joubert, Rousselet, Fabre-Thorpe, & Fize, 2009). Ja 
m Eii (backward mask) 的 类 型 (Freeman, Loschky, 
& Hansen, 2015; Loschky, Hansen, Sethi, & 
Pydimarri, 2010), 情绪 信息 (Subramanian, Shankar, 
Sebe, & Melcher, 2014; 4845, BHM, WITH, 
B PRG, 2015). WAS A AY WLS 4 ff (viewpoint) 
(Loschky, Ringer, Ellis, & Hansen, 2015), 工作 记 
IZ fi BPS, ALATA, RER, 2015), MAZE 
(Vanmarcke & Wagemans, 2015; Vanmarcke et al., 
2016) 和 先前 经 验 / 期 望 (Duh & Wang, 2014; 
Greene, Botros, Beck, & Fei-Fei, 2015; 孙 雨 生 ， 
张 智 君 ， 吴 彬 星 , 2017) 等 因素 的 影响 。 现 实 场景 中 
包含 的 信息 错综复杂 , 任何 条 件 的 改变 都 有 可 能 


获取 的 场景 主旨 概念 ， 如 “森林 ”“ 湖 泊 ”“ 卧 室 ”、 
“厨房 ”等 属于 基本 水 平 概念 。 而 上 级 水 平 概念 较 
基本 水 平 概念 有 更 大 的 外 延 ， 常 用 于 该 问题 研究 
的 上 级 水 平 场景 概念 是 “自然 与“ 人工? 或 者 “ 室 
内 ”与 “室外 ”等 。 那 么 在 场景 主旨 加 工 过 程 中 ,， 视 
觉 系统 会 优先 加 工 哪个 层级 的 视觉 信息 呢 ? 
物体 加 工 的 研究 发 现 ， 人 类 对 表征 物体 的 基 
本 水 平 概念 的 通达 先 于 对 上 级 水 平 概念 的 通达 
(如 , Rosch, Mervis, Gray, Johnson, & Boyes-Braem, 
1976; 但 见 Mack & Palmeri, 2015; Wu, Crouzet, 
Thorpe, & Fabre-Thorpe, 2015)。 后 来 这 一 观点 被 
引申 到 场景 主旨 加 工 的 问题 上 。Tversky 和 
Hemenway (1983) 最 先 对 场景 主 则 的 层级 加 工 进 
行 研 究 ， 结果 发 现 被 试 偏向 于 使 用 具有 基本 概念 
属性 的 词语 来 对 场景 进行 描述 ,并 由 此 认为 场景 
主旨 的 基本 水 平 得 到 优先 加 工 。 
然而 ,近年 来 研究 者 指出 列 属 性 的 方式 来 检 
验 层级 加 工 优先 性 会 受到 属性 词 词 频 的 影响 ， 而 
基本 水 平 属 性 词 的 词 频 更 高 ， 这 可 能 会 抵消 原 有 
的 上 级 水 平 优势 ( 见 综述 , Fabre-Thorpe, 2011)。 该 
观点 也 得 到 了 相关 研究 的 支持 : 首先 ， 视 觉 系统 
对 上 级 水 平 信息 的 获取 用 时 更 短 。 例 如 ，Fabre- 
Thorpe 领导 的 研究 小 组 采用 go/no-go 范式 要 求 被 
试 尽 可 能 快 地 对 场景 进行 上 级 水 平和 自然 场景 ” 
或 * 人 工场 景 ") 或 基本 水 平 (海洋 ”、“ 山 脉 "、“ 城 


影响 人 眼 对 当前 场景 的 感知 。 视 觉 系 统 无 法 在 一 
和 警 的 时 间 内 读 和 人 所 有 信息 ,但 大 脑 能 够 灵活 地 运 
用 自身 的 有 限 资源 来 获取 最 有 诊断 性 并 易于 提取 
的 信息 ， 对 场景 主旨 做 出 识别 。 


3 ”相关 的 争议 性 问题 


3.1 场景 主旨 加 工 的 层级 优先 性 
近年 来 , 场景 主旨 加 工 的 层级 加 工 优先 性 成 
为 场景 知觉 研究 领域 的 热点 问题 。 对 该 问题 的 研 


究 源 于 早期 认 知 心理 学 关于 概念 表征 通达 的 问题 ， 


存在 两 种 截然 相反 的 观点 : 基本 水 平 加 工 优先 
(basic level superority) 和 上 级 水 平 加 工 优先 
(superordinate level superority) 的 观点 。 对 同一 幅 
场景 图 片 ， 我 们 能 够 使 用 不 同 层 级 的 概念 来 对 其 
进行 命名 。 例 如 ,一 幅 森 林 的 场景 图 片 可 以 被 命 
名 为 “和 森林 ”、“ 户 外 ”或 者 “自然 "”， 这 几 个 概念 虽然 
都 能 够 在 一 定 程度 上 反映 森林 的 意义 ,， 却 具有 不 
同 的 内 涵 和 外 延 。 基 本 水 平 概念 曾 被 认为 是 优先 


市 "街道 ”等 ) 的 分 类 判断 ， 结 果 发 现 上 级 水 平 判 
断 任务 的 耗 时 (380~390 ms) 显 著 小 于 基本 水 平 
(400~460 ms) (4, Joubert, Rousselet, Fize, & 
Fabre-Thorpe, 2007; Macé, Joubert, Nespoulous, & 
Fabre-Thorpe, 2009), Greene 和 Oliva (2009a, 2009b) 
采用 心理 物理 学 方法 将 场景 分 类 任务 的 正确 率 达 
到 75% 时 所 需要 的 场景 刺激 呈现 时 间 定 义 为 完成 
该 分 类 任务 所 需要 的 最 小 时 间 阔 限 ， 将 被 试 完成 
基本 水 平和 上 级 水 平分 类 任务 的 最 小 时 间 阔 限 相 
比较 ,发现 上 级 水 平 阔 限 显著 小 于 基本 水 平 。 其 
次 , 视觉 系统 对 上 级 水 平 的 信息 获取 更 敏感 。 

Loschky 和 Larson (2010) 采 用 人 迫 选任 务 , 在 目标 
场景 后 呈现 掩蔽 图 片 和 提示 词 ， 要 求 被 试 对 场景 
图 片 和 提示 词 做 类 别 匹配 判断 ， 结 果 发 现在 目标 
场景 的 呈现 时 间 小 于 72 ms 的 情况 下 被 试 对 上 级 
水 平 概念 的 敏感 度 更 高 。 近 期 Sun, Ren, Zheng， 
Sun 和 Zheng (2016) 采 用 双 任 务 范式 结合 工作 记 
忆 任 务 和 场景 主旨 类 别 辨别 任务 ， 探 讨 场景 主旨 
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加 工 的 层级 性 ， 结 果 发 现 了 上 级 水 平 的 加 工 优势 ， 
且 在 场景 主旨 类 别 辨 别 过程 中 ， 先 利用 的 是 场景 
中 的 空间 信息 ， 而 后 利用 场景 中 的 客体 信息 。 这 
些 研 究 均 支持 了 上 级 水 平 的 概念 相 较 于 基本 水 平 
能 够 更 快 被 获取 的 观点 。 

然而 ,常用 来 作为 场景 主旨 研究 的 不 同上 级 
水 平 概念 (室内 -室外 与 人 工 - 自 然 ) 之 间 的 本 质 也 
不 相同 .Kadar 和 Ben-Shahar (2012) 将 场景 类 别 
扩大 到 15 种 ,以 考察 上 级 水 平分 类 优势 是 否 具有 
普遍 性 ,结果 发 现在 类 别 判断 任务 中 , 场景 主旨 
加 工 首先 进行 的 是 自然 性 / 非 自 然 性 的 判断 ， 随 后 
才 会 进行 室内 /室外 或 是 基本 水 平 类 别 判断 。 除 此 
之 外 , 室内 与 室外 场景 还 具有 相似 的 光谱 特性 ， 
这 与 自然 和 人 工 概念 光谱 特性 的 区 别 不 同 (Oliva 
& Torralba, 2001)， 且 采用 go/no-go 范式 获得 的 自 
然 /人 工 概念 的 上 级 水 平 优势 在 室内 /室外 类 别 中 
消失 不 见 了 (Banno & Saiki, 2015)。 因 此 , 在 考虑 
场景 主旨 层级 加 工 优先 性 问题 的 过 程 中 ， 对 不 同 
上 级 水 平 概念 的 区 别 也 是 有 必要 的 。 

针对 这 两 种 相互 矛盾 的 观点 ， 目 前 的 研究 更 
前 向 于 认为 场景 主旨 的 研究 具有 上 级 水 平 加 工 优 
势 , 但 这 种 优势 效应 并 不 稳定 。 首 先 , 场景 的 类 间 / 
类 内 关系 会 对 场景 主旨 分 类 任务 产生 影响 。Greene 
和 Fei-Fei (2014) 采 用 stroop 范式 之 变 式 对 视觉 分 
类 的 自动 性 进行 研究 ,结果 发 现 基本 水 平 的 分 类 
是 自动 的 ， 而 上 级 水 平 的 分 类 不 是 ,支持 基本 水 
平 优先 加 工 的 观点 。 其 次 ， 基 本 水 平 类 别 的 相似 
性 程度 (例如 ， 街 道 和 市 中 心 的 相似 性 大 于 高 速 公 
路 和 市 中 心 的 相似 性 ) 能 够 调节 场景 主旨 加 工 的 
上 级 水 平 优势 ， 甚 至 使 结果 反 转 而 产生 基本 水 平 


=> 


注意 资源 的 参与 吸引 了 诸多 研究 者 的 兴趣 。 前 人 
对 此 问题 的 回答 正在 经 历 一 个 富有 和 争议 的 过 程 。 
部 分 研究 者 认为 场景 主旨 的 加 工 不 需要 注意 资源 
的 参与 ， 是 一 个 自动 化 的 过 程 (如 ，Li，VanRullen， 
Koch, & Perona, 2002); 另 一 些 研究 者 认为 场景 主 
旨 的 提取 需要 注意 参与 ,注意 资源 的 不 足 会 导致 
场景 主旨 加 工 绩 效 的 下 降 ( 如 ,Cohen,，Alvarez, & 
Nakayama, 2011)。 目 前 对 该 问题 的 研究 多 采用 双 
任务 范式 ， 即 要 求 被 试 在 同一 时 间 内 完成 两 种 任 
务 ， 中 心 任 务 需 要 注意 的 参与 ,考察 被 试 集中 注 
意 来 完成 中 心 任务 是 否 对 场景 主旨 的 分 类 或 识别 
成 绩 产 生 影响 ， 若 不 产生 影响 ， 则 说 明 两 者 在 注 
意 资源 的 使 用 上 不 存在 相互 干扰 ， 即 场景 主旨 的 
加 工 不 需要 注意 的 参与 。 

一 些 研究 者 采用 字母 辨别 任务 (Li et al., 2002; 
Poncet, Reddy, & Fabre-Thorpe, 2012) 、 元 音字 母 
有 无 判断 任务 (Walker， Stafford, & Davis, 2008) 作 
为 中 心 任务 时 发 现 ,视觉 系统 对 自然 场景 进行 识 
别 和 分 类 能 力 没 有 受到 损害 ， 这 意味 着 场景 主旨 
加 工 不 需要 注意 资源 的 参与 。 有 研究 者 采用 负 启 
动 范式 获得 了 类 似 的 发 现 (Otsuka & Kawaguchi, 
2007)。 还 有 研究 者 发 现 ， 人 类 视觉 系统 可 以 在 无 
意识 的 条 件 下 习 得 场景 类 别 规则 的 统计 信息 
(Brady & Oliva, 2008)。 然 而 , Cohen 等 人 (2011) 对 
上 述 的 研究 设计 提出 了 质疑 ， 认 为 可 能 是 场景 主 
旨 加 工 需 要 的 注意 资源 相对 较 少 ， 而 双 任 务 范 式 
中 用 来 占用 注意 资源 的 无 关 任务 难度 较 小 ,因此 
单 / 双 任务 对 场景 分 类 任务 的 成 绩 几 乎 不 产生 影 
响 。 他 们 采用 多 物体 追踪 任务 (multiple object task, 
MOT) 作 为 分 散 注 意 的 中 心 任务 , 该 任务 的 特点 


优势 (Banno & Saiki, 2015)。 近 期 的 计算 模型 研究 
上 暗示， 场景 主旨 层级 加 工 的 优先 顺序 与 刺激 的 相 
似 性 有 关 (Serre，2016; Sofer, Crouzet, & Serre, 
2015)。 由 此 可 见 , 场景 主旨 的 上 级 水 平 加 工 优势 
可 能 受 个 体 词汇 结构 、 上 级 水 平 概念 种 类 、 任 务 
中 的 干扰 项 和 不 同类 别 间 相 似 性 等 因素 的 影响 ， 
但 对 于 这 种 不 稳定 性 产生 的 原因 仍 不 清楚 ， 有待 
进一步 的 研究 。 

3.2 ”场景 主旨 加 工 对 注意 资源 的 需求 


是 需要 连续 不 间断 的 持续 注意 才能 完成 。 结 果 发 
现场 景 主旨 任务 成 绩 显 著 下 降 ， 意味 着 场景 主旨 
的 加 工 需 要 注意 资源 的 参与 。Mack 和 Clarke 
(2012) 在 外 周 采 用 十 字 架 水 平 - 竖 直 长 短 判断 任 
务 ,， 而 中 心 旦 现 一 张 场景 或 马赛 克 掩蔽 图 片 ， 实 
验 中 仅仅 要 求 被 试 完成 十 字 架 长 短 判 断 任务 , 结 
果 发 现 ， 那些 在 任务 结束 后 报告 注意 到 场景 图 片 
的 被 试 ， 在 十 字 架 长 短 判 断 任务 上 的 成 绩 显著 低 
于 那些 没有 注意 到 其 他 刺激 的 被 试 。 结 果 表 明 对 


与 层级 加 工 密切 相关 的 另 一 个 问题 就 是 场景 
主旨 加 工 对 注意 资源 的 需求 。 早 期 的 研究 发 现场 
景 主旨 加 工 是 一 项 非常 高 效 的 认 知 活动 , 可 以 在 
极 短 的 时 间 内 完成 ; 那么 场景 主旨 加 工 是 否 需 要 


场景 刺激 的 无 意识 注意 会 降低 其 他 耗费 注意 资源 

任务 的 成 绩 (也 见 Clarke & Mack, 2014)。 这 些 结果 

均 支 持 场景 主旨 提取 需要 注意 参与 的 观点 。 
除 此 之 外 ，Greene 和 Fei-Fei (2014) 年 采用 
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stroop 范式 之 变 式 , BRA RRA GBR 
主旨 类 别 一 致 或 不 一 致 的 单词 ， 并 要 求 被 试 迅 速 
对 单词 进行 识别 ,结果 发 现 当 背景 场景 与 目标 单 
词 意义 一 致 时 ， 对 单词 的 识别 需要 时 间 更 短 ， 说 
明 场 景 与 单词 的 语义 一 致 性 对 单词 的 识别 产生 了 
促进 作用 。 该 结果 表明 背景 场景 在 没有 任务 要 求 
的 情况 下 得 到 自动 化 加 工 ， 暗 示 这 种 自动 化 并 未 
占用 注意 资源 。 对 此 , Gronau 和 Izoutcheev (2017) 
发 现 当 场景 主旨 识别 作为 无 关 任务 (处 于 边缘 视 
野 ) 时 ， 视 觉 系 统 在 完成 相关 任务 (处 于 中 心 视 野 ) 
的 同时 ， 不 能 够 自动 地 对 场景 主导 进行 识别 。 根 
据 Gronau 和 Izoutcheev (2017) 的 结论 可 以 认为 
Greene 和 Fei-Fei (2014) 研 究 结果 产生 的 原因 可 能 
是 视觉 系统 在 完成 中 心 任务 的 同时 会 对 呈现 在 注 
意 中 心 的 背景 进行 自动 化 加 工 ， 这 种 加 工 建立 在 
中 心 任 务 与 无 关 背 景 重 三 的 空间 关系 之 上 ， 当 两 
者 分 离 且 场 景 刺激 与 任务 无 关 时 ， 这 种 自动 化 加 
工 就 不 复 存在 了 。 这 一 猜测 还 有 待 进一步 的 实验 
验证 。 

为 了 解释 行为 实验 的 这 些 相 互 矛盾 的 观点 ， 
研究 者 在 近期 的 ERPs 研究 中 , 仍然 采用 双 任 务 
范式 ， 发 现在 刺激 呈现 的 250ms 以 内 (大 约 220 ms), 
对 场景 刺激 做 自然 /人 工分 类 时 的 脑 电 变化 不 受 
注意 资源 是 否 减 少 的 影响 , 但 注意 资源 的 减少 会 
调节 不 同类 别 场景 在 脑 电 上 差异 表现 的 时 间 。 对 
此 研究 者 认为 ,注意 资源 的 多 少 不 影 响 场景 的 早 
期 加 工 ， 但 会 对 后 期 场景 局 部 和 细节 信息 的 加 工 
产生 影响 ,并 决定 大 脑 对 场景 记忆 的 深度 (Groen， 
Ghebreab, Lamme, & Scholte, 2016; Harel, Groen, 
Kravitz, Deouell, & Baker, 2016). 

场景 主旨 加 工 可 能 需要 少量 注意 资源 的 参 
与 。 如 果 当 前 任务 需要 将 注意 集中 在 与 场景 存在 
空间 重 准 的 刺激 上 ， 抑 或 当前 任务 难度 不 足以 耗 
尽 所 有 的 注意 资源 ,这 些 情况 下 场景 主旨 加 工 对 
注意 资源 的 占用 可 能 难以 察觉 ; 反之 则 不 然 。 虽 
然 有 研究 为 场景 主旨 加 工 不 需要 注意 参与 提供 了 
证 据 , 但 该 研究 中 的 不 同 任务 相关 刺激 是 同时 呈 
M, 这 可 能 会 对 结果 产生 影响 (Gronau & Izoutcheev, 
2017), 这 样 的 猜测 还 有 待 将 来 进一步 的 实验 验证 。 


4 真实 场景 主旨 的 加 工 机 制 


41 早期 的 场景 主旨 加 工 理论 
最 初 的 场景 主旨 加 工 理论 是 以 物体 为 中 心 的 


出 


(object-centered) 场 景 加 工 理 论 。 该 理论 认为 场景 
中 的 具有 诊断 性 意义 的 物体 是 视觉 系统 进行 场景 
主 由 识别 和 分 类 的 依据 ， 视 觉 系 统 通过 结合 场景 
中 的 物体 以 及 先前 经 验 中 物体 可 能 出 现 的 位 置 来 
对 当前 的 场景 主旨 进行 判断 (如 ，De Graef, 
Christaens & D’Ydewalle, 1990)。 或 者 可 以 说 , 视 
觉 系 统 对 场景 中 的 一 个 或 者 几 个 突出 物体 的 识别 
即 可 以 实现 对 场景 主旨 的 有 效 识 别 (Friedman， 
1979)。 这 类 理论 很 早 就 遭 到 质疑 和 反驳 ， 因 为 有 
研究 者 发 现 观察 者 不 需要 对 场景 中 的 物体 进行 识 
别 就 能 够 对 场景 做 出 正确 的 分 类 判断 。 
4.2 空间 包 囊 理论 

针对 以 物体 为 中 心 的 场景 加 工 理论 的 不 足 ， 
研究 者 又 提出 了 以 场景 为 中 心 的 (scene-centered) 
场景 加 工 理论 (如 , Schyns & Oliva, 1994)。 其 基本 
观点 为 , 场景 的 整体 特性 才 是 场景 主旨 加 工 所 需 
要 的 信息 成 分 。 同 时 ,大 量 研究 也 表明 ， 多 种 场景 
整体 特性 (如 场景 的 纹理 、 颜 色 、 体 积 或 者 空间 频 
率 等 ) 的 变化 均 会 对 视觉 系统 的 场景 识别 过 程 产 

影响 。 然 而 这 些 研究 仅仅 证 明 多 种 整体 特征 在 

场景 加 工 中 的 作用 和 价值 ， 却 难以 解释 信息 是 以 
怎样 的 形式 被 提取 和 进一步 加 工 的 。 

为 了 回答 上 述 的 问题 Oliva 及 其 同事 提出 了 
以 场景 为 中 心 的 加 工 理论 -空间 包 庄 (spatial 
envelope) 理 论 ， 该 理论 试图 寻找 视觉 系统 在 场景 
早期 加 工 过 程 中 提取 的 基本 单元 (primary 
element),， 假设 大 脑 仅 通过 对 基本 单元 的 编码 和 
表征 就 能 完成 对 场景 主旨 的 加 工 。 空 间 包 右 理论 
提出 5 种 全 局 特征 , 分 别 是 自然 性 (naturalness)、 
开放 性 (openness) 、 粗 糙 度 (roughness) 、 延 伸 性 
(expansiom)、 坚 固 性 Cuggedness) (Oliva & Torralba, 
2001)， 并 在 随后 的 研究 中 将 其 扩展 到 7 种 (Greene 
& Oliva, 2009b)。Oliva 等 人 认为 这 些 全 局 特征 是 
由 多 种 低 水 平 特征 整合 形成 ， 涵 盖 了 不 同 频率 的 
空间 信息 ,能够 为 场景 主旨 的 识别 提供 粗略 但 充 
分 的 信息 资源 。 同 时 也 有 研究 指出 ,全 局 特性 的 
加 工 不 受 视觉 疲劳 的 影响 ,被 认为 是 一 种 自动 化 
的 信息 加 工 (Csath6, van der Linden, & Gács, 2015)。 

Greene 和 Oliva (2006) 发 现 ， 在 对 场景 图 片 进 
行 快速 分 类 时 ， 对 与 目标 场景 拥有 某 种 相同 全 局 
特性 的 干扰 场景 更 容易 虚报 。 例 如 ， 要 求 被 试 判 
断 快速 呈现 的 场景 图 片 是 否 属于 “森林”， 那 么 与 
森林 一 样 具 有 “ 低 开 放 性 ”全 局 特征 的 非 森林 场景 
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较 其 他 不 具有 此 特征 的 干扰 项 更 容易 被 识别 为 
“属于 森林” 他们 认为 产生 这 种 混淆 的 原因 可 能 
是 全 局 特征 被 视觉 系统 用 来 作为 主旨 识别 的 依 
据 。Greene 和 Oliva (2009a) 利 用 计算 机 编写 了 以 
7 种 全 局 特征 为 依据 的 场景 识别 算法 ， 同 时 使 
该 计算 机 算法 和 人 类 被 试 来 完成 相同 的 场景 分 类 
任务 , 结果 发 现 二 者 在 反应 时 、 正 确 率 甚至 虚报 
率 上 均 无 显著 差异 , 表明 计算 机 全 局 特征 算法 较 
好 地 模拟 了 人 类 视觉 系统 在 场景 识别 和 分 类 中 的 
决策 偏向 ， 支 持 了 场景 主旨 能 够 仅仅 通过 对 全 局 
特征 提取 和 整合 而 获得 的 理论 假设 。 然 而 ， 最 近 
的 一 项 研究 采用 重复 盲 视 (repetition blindness) 范 
REM, 观察 者 在 加 工场 景 的 前 100~150 ms 内 ， 
所 表征 的 是 局 部 的 视觉 特征 ， 而 不 是 更 抽象 的 类 
别 特征 (Goldzieher Andrews, & Harris, 2017). 

以 物体 为 中 心 的 场景 加 工 理论 过 分 强调 了 物 
体 的 作用 ， 而 空间 包 庄 理论 过 分 看 重 全 局 特性 的 
作用 ,二 者 缘 忽 略 了 场景 、 物 体 、 物 体 情境 关系 
之 间 天 然 存在 不 可 分 割 的 空间 和 语义 联系 ， 且 缺 
乏 相 关 神 经 机 制 的 研究 。 随 着 研究 的 深入 ， 研 究 
者 逐步 将 ERP 和 fMRI 技术 应 用 到 对 场景 加 工 机 
制 的 研究 上 来 ， 提 出 了 场景 联结 加 工 假设 。 
43 ”场景 的 联结 加 工 假设 

场景 联结 加 工 (associative processing (Kix A 
两 点 核心 内 容 。 首 先 , 大 脑 中 储存 了 在 长 期 经 验 
中 同时 出 现 并 已 形成 联结 的 重要 场景 信息 ， 而 对 
场景 的 加 工 则 是 激活 这 种 联结 信息 并 加 以 提取 的 
过 程 ; 其 次 ,大 脑 的 视觉 系统 中 并 不 存在 独立 的 
场景 加 工区 域 ， 这 些 已 知 场景 选择 性 区 域 的 作用 
实质 是 完成 对 外 界 信息 中 联结 的 加 工 , 这 种 联结 
言 息 可 以 是 场景 的 整体 特性 、 场 景 中 物体 间 的 情 
境 关 系 等 视觉 信息 ， 也 可 以 是 听觉 信息 或 其 他 感 
党 通道 的 信息 (Aminoff & Tarr, 2015; Bar, Aminoff, 
Mason, & Fenske, 2007)。 例 如 ， 旧 子 和 椅子 在 场 
景 中 经 常 一 同 出 现 , 大 脑 皮 层 可 以 根据 经 验 将 这 
两 种 刺激 形成 语义 联结 并 储存 在 长 时 记忆 中 ， 当 
新 的 外 界 刺 激 中 出 现 了 这 种 联结 关系 , 便 会 对 长 
时 记忆 的 语义 联结 信息 进行 激活 ， 利用 这 种 联结 
言 息 完 成 对 当前 场景 的 加 工 。 值 得 注意 的 是 ， 联 
结 的 形式 并 不 是 固定 的 ,可 以 是 语义 联结 、 空 间 
关系 联结 或 情绪 联结 等 ， 是 在 长 期 经 验 中 通过 学 
习 而 形成 并 稳定 下 来 的 (Bar et al., 2007)。 

Aminoff 和 Tarr (2015) 设 计 了 一 些 由 无 意义 
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图 形 组 成 的 人 工 联结 刺激 : 保留 图 形 间 形 状 联合 
信息 (图 形 类 型 不 变 ,位 置 变化 ， 黑 色 背 景 ) 的 刺 
激 集 或 者 保留 图 形 间 空间 联合 信息 (图 形 类 型 变化 ， 
位 置 不 变 , 黑色 背景 ) 的 刺激 集 , 通过 学 习 让 大 脑 
对 图 形 中 两 种 联结 信息 纳入 记忆 , 在 正式 实验 过 
程 中 要 求 被 试 判断 刺激 中 包含 了 哪 一 种 联结 信息 ， 
结果 大 脑 皮 层 的 场景 选择 区 域 对 人 工 联 结 刺 激 的 
激活 与 真实 场景 类 似 ， 表 明 大 脑 对 人 工 联结 刺激 
的 加 工 与 真实 场景 相似 ,支持 了 场景 选择 区 域 的 
作用 是 对 场景 中 的 联结 信息 进行 加 工 的 观点 。 
场景 联结 加 工 假设 为 大 量 研究 的 结果 提供 了 
可 能 的 解释 。 首 先 , 场景 联结 加 工 理论 为 物体 与 
场景 在 加 工 过 程 中 的 相互 促进 提供 了 解释 。 一 方 
面 , 场景 对 处 于 其 中 物体 的 识别 、 搜 索 和 记忆 存 
在 促进 作用 。 例 如 ， 处 于 一 致 物体 间 情 境 关 系 中 
的 物体 更 容易 被 搜索 和 识别 (如 ，Castelhano & 
Heaven, 2011; Davenport & Potter, 2004; 白 学 军 ， 
RER, FLA, 2008; HAZ, 王 福 兴 ,， 徐 菲菲 ， 
1 继 亮 ， 2010); 对 场景 背景 中 的 目标 物体 完成 搜 
索 任务 和 有 意 记忆 任务 , 搜索 任务 中 目标 物体 的 
回忆 效果 更 佳 (Draschkow,，Wolfe, & V6, 2014; 
Josephs, Draschkow, Wolfe, & V6, 2016) 等 ; 另 一 
方面 , 已 有 研究 发 现 物体 也 能 促进 对 所 处 场景 信 
息 的 加 工 。Davenport 和 Potter (2004) 发 现 当 物体 
与 场景 情境 一 致 时 ， 被 试 对 该 场景 识别 的 正确 率 
提升 。Wu, Wang 和 Pomplun (2014) 将 场景 图 片 中 
的 中 心 物 体 取出 与 灰色 背景 融合 并 打 乱 其 空间 关 
系 ， 要 求 被 试 完成 对 合成 场景 的 分 类 任务 ， 结 果 
发 现任 务 的 正确 率 显 著 高 于 平均 水 平 。 这 表明 在 
只 保留 物体 间 情 境 关 系 的 情况 下 ， 视 觉 系 统 仍然 
能 够 根据 物体 间 的 联结 信息 来 完成 场景 的 类 别 判 
断 任务 ， 近 期 确 有 研究 暗示 场景 的 情境 一 致 性 确 
实 会 影响 场景 的 分 类 (Collet, Fize, & VanRullen, 
2015)。 另 外 在 fMRI 研究 中 ,情境 一 致 的 场景 和 
物体 对 PPA 区 域 的 激活 更 强 (Bar & Aminoff, 2003; 
Troiani, Stigliani, Smith, & Epstein, 2014)。 同 时 ， 
Stansbury, Naselaris 和 Gallant (2013) 发 现 视觉 系 
统 对 场景 分 类 的 过 程 中 物体 出 现 的 可 能 性 参与 
了 场景 表征 的 形成 。 这 些 结果 暗示 ,场景 与 物体 的 
加 工 并 不 是 分 离 的 ， 而 是 相互 关联 共同 完成 的 ， 这 
种 联合 信息 的 存在 为 联结 加 工 理论 提供 了 支持 。 
其 次 , 场景 联结 加 工 理论 为 语义 和 句法 不 一 
致 的 ERPs 研究 结果 提供 了 解释 。Biederman， 
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Mezzanotte 和 Rabinowitz (1982) 首 次 提出 用 语义 
和 和 句法 来 描述 不 同 的 场景 -物体 的 一 致 性 关系 ， 
比如 消防 栓 树 立 在 街道 旁 属于 语义 一 致 ， 而 悬浮 
在 街道 旁 就 属于 语法 不 一 致 。 将 肥皂 盒 放 在 桌 鸡 
上 属于 语法 一 致 ， 但 与 笔记 本 电脑 摆 在 一 起 就 属 
于 语义 不 一 致 。 一 项 ERPs 的 研究 结果 发 现场 景 
与 物体 的 语义 不 一 致 引发 N400 波 , 句法 结构 不 
一 致 引 发 P600 波 (V6 & Wolfe, 2013)， 而 对 应 的 脑 
电 成 分 在 句子 理解 的 语义 与 句法 不 一 致 情况 下 也 
会 出 现 。 如 果 假 设 大 脑 皮层 对 刺激 的 加 工 是 对 不 
同 刺 激 之 间 联 结 的 提取 和 激活 , 那么 这 种 物体 与 
背景 不 同 联结 方式 (语义 不 一 致 /句法 不 一 致 ) 引 起 
不 同 加 工 方式 和 脑 电 成 分 的 现象 就 可 以 得 到 解 
释 -N400 效应 在 多 种 形式 的 刺激 中 被 发 现 , 例如: 
语言 、 图 片 、 物 体 、 动 作 、 声 音 等 (Kutas & 
Federmeier, 2011)， 这 意味 着 不 同类 型 刺激 的 语义 
加 工 存在 一 个 共同 的 脑 机 制 , 那么 语义 /句法 这 种 
物体 与 场景 信息 联结 方式 的 一 致 性 也 可 能 是 不 同 
刺激 类 型 出 现 相 同 脑 电 成 分 的 原因 。 

再 次 , 场景 联结 加 工 理论 为 现 有 的 场景 选择 
区 域 对 非 场 景 刺 激 的 强 激活 提供 了 解释 。 大 脑 皮 
层 目 前 已 知 的 场景 选择 区 域 是 根据 其 对 场景 刺激 
区 别 于 其 他 类 型 刺激 所 产生 的 反应 偏向 性 确定 而 
来 的 。 然 而 随 着 研究 的 深入 , 一 些 场景 选择 性 区 
域 被 发 现 参 与 了 *“ 非 场景 ”类 刺激 的 编码 。 以 旁 海 
马 空 间 加 工区 (Parahippocampal Place Area, PPA) 
为 例 : PPA 区 域 对 熟悉 的 面孔 比 不 熟悉 面孔 的 反 
应 更 大 (Bar Aminoff, & Ishai, 2008)， 对 具有 高 空 
间 情 境 性 的 物体 (如 ,车 灯 ) 比 具有 低空 间 情 境 性 
的 物体 (如 , 水壶 ) 的 激活 更 大 (Bar,，Aminoff,& 
Schacter, 2008)， 对 脱离 背景 的 物体 较 面 孔 刺 激 的 
激活 更 大 (Epstein & Kanwisher 1998) 等 。 场 景 选 
择 性 脑 区 对 非 场 景 类 型 刺激 的 反应 体现 了 联结 加 
工 理论 中 “无 独立 场景 加 工 脑 区 ”的 观点 ， 即 大 脑 
对 联结 信息 的 加 工 并 不 根据 信息 类 型 的 不 同 而 做 
出 区 分 。 


5 场景 主旨 加 工 的 神经 基础 


场景 主旨 加 工 的 神经 基础 研究 主要 包括 两 个 
方面 的 内 容 : 场景 主旨 加 工 的 时 间 动 力 特性 (时 程 
特点 ) 和 场景 主旨 加 工 特异 性 的 脑 区 。 

5.1 ”时 间 动 力 特 性 
人 类 视觉 系统 能 够 迅速 提取 场景 主旨 的 信息 ， 


对 场景 主旨 加 工 的 时 间 时 程 的 研究 往往 采用 较为 
短暂 的 呈现 时 间 ， 要 求 记录 生理 信号 的 仪器 设备 
需要 有 较 高 的 时 间 分 辨 力 ， 相关 的 研究 工作 主要 
是 通过 脑 电 和 脑 磁 信号 来 完成 的 ， 目 前 这 方面 的 
研究 相对 较 少 。 

Thorpe, Fize 和 Marlot (1996) 率 先 采 用 脑 电 
技术 测量 了 视觉 系统 的 加 工 速度 ,结果 发 现 人 
类 视觉 系统 在 刺激 呈现 后 的 大 约 150 ms 就 可 以 
将 包含 动物 的 场景 与 包含 非 动 物 的 场景 区 分 开 
来 。 随 后 Sato 等 人 (1999) 率 先 利用 脑 磁 图 
(magnetoencephalography，MEG) 技 术 ， 比 较 了 大 
脑 对 场景 和 面孔 的 神经 反应 ， 以 此 探讨 场景 主旨 
加 工 的 时 间 动 力 特 性 。 结 果 发 现 , 场景 图 片 诱发 
的 MEG 信 和 号 的 潜伏 期 ( 约 300 ms) 长 于 面孔 图 片 诱 
发 的 MEG 信号 的 潜伏 期 ( 约 160 ms)。 然 而 , Rivolta, 
Palermo，Schmalzl 和 Williams (2012) 利 用 同样 的 
LAK, 却 发 现场 景 刺激 产生 了 与 面孔 同样 早 的 类 
别 特异 性 的 MEG 成 分 (M100p，100~130 ms). 
Bastin 等 人 (2013) 采 用 脑 电 技术 通过 两 个 实验 分 
离 出 神经 活动 中 早期 (200~500 ms) 的 刺激 驱动 效 
应 和 晚期 (600~800 ms) 的 任务 相关 效应 ,并 同时 
记录 到 了 最 强 的 y 波 (50~150 Hz). Groen 及 其 同 
事 将 场景 图 像 的 两 个 统计 特征 一 空间 相干 (spatial 
coherence) FU X} HE fÉ H (energy contrasb 与 场景 主 
旨 加 工 联系 起 来 ， 发 现 这 两 个 统计 指标 均 对 早 基 
(100~150 ms) 单 个 试 次 的 事件 相关 电位 的 波幅 具 
有 调节 作用 ， 且 空间 相干 的 影响 可 以 持续 到 晚期 
( 约 250 ms) 的 活动 水 平 ， 对 场景 进行 自然 /人 工 的 
分 类 判断 时 ， 神 经 活动 的 幅度 大 小 与 空间 相干 有 
X, 但 与 对 比 能 量 无 关 (Groen, Ghebreab, Prins, 
Lamme, & Scholte, 2013)。 在 后 续 的 研究 中 ,他们 
还 发 现 虽 然 注 意 资 源 对 场景 刺激 所 诱发 的 早期 (< 
250 ms) 电 位 活动 几乎 没有 影响 ,但 会 对 诱发 的 晚 
期 (300~500 ms) 电 位 活动 产生 较 大 的 影响 (Groen 
et al., 2016)。 针 对 以 往 研究 可 能 混淆 了 非 场 景 刺 
激 与 场景 刺激 之 间 的 物理 差异 所 导致 的 神经 信号 
的 不 同 ,最近 的 一 项 研究 确定 P2 成 分 (潜伏 期 为 
约 为 220 ms) 是 场景 主旨 加 工 的 标记 (Harel et al., 
2016)。 

5.2 ”特异 性 脑 区 

相 比 较 而 言 ， 对 场景 主旨 加 工 特异 性 脑 区 的 
研究 则 探讨 的 是 在 更 长 时 间 尺 度 ( 数 秒 钟 ) 上 呈现 
场景 刺激 时 ， 大脑 不 同 区 域 的 选择 性 激活 ， 这 类 
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人 研究 要 求 仪 器 设备 需要 有 较 高 的 空间 分 辨 力 ， 相 脑 区 ， 而 Silson, Chan, Reynolds, Kravitz 和 Baker 
关 工 作 主 要 是 通过 fMRI 技术 来 完成 的 ,， 这 方面 。”(2015) 认 为 PPA 与 OPA 分 别 具 有 的 上 下 视野 偏差 
的 研究 相对 较为 丰富 。 (upper and lower visual field biases) 可 能 是 两 者 在 

研究 主要 采用 fMRI 技术 , 涉及 到 3 个 对 场景 功能 上 存在 互补 性 的 证 据 。 除 此 之 外 , OPA 与 其 他 
类 刺激 具有 反应 偏向 性 的 脑 区 : 海马 劳 区 两 个 场景 选择 性 脑 区 在 场景 加 工 中 的 反应 偏向 性 
(parahippocampal place area, PPA) (如 , Epstein & 有 许多 相似 之 处 ， 例 如, 三 者 都 具有 熟悉 性 偏向 
Kanwisher, 1998; Epstein，2005) 、 压 后 皮层 (Epstein, Higgins, Jablonski, & Feiler, 2007) 、 直 线 


(retrosplenial complex, RSC) (Maguire, 2001), 、 枕 üli (Nasr, Echavarria, & Tootell, 2014) 等 。 目 前 关 
X (occipital place area, OPA) (Dilks, Julian, Paunov, 于 OPA 脑 区 的 更 多 功能 仍然 在 探索 之 中 ,关于 3 
& Kanwisher, 2013)， 以 及 一 个 对 物体 类 刺激 具有 个 场景 选择 脑 区 的 反应 偏向 性 和 OPA 的 真正 功能 


反应 偏向 的 脑 区 : 桃 叶 外 侧 复 合体 (lateral occipital 还 需要 进一步 的 实验 验证 。 


complex, LOC) (Malach et al., 1995). 枕 叶 外 侧 复 合体 (lateral occipital complex, 
早期 研究 发 现 PPA 与 场景 几何 构 型 或 空间 布 LOC) 最 初 由 于 其 对 物体 的 反应 偏向 性 而 被 发 现 ， 
局 (Rajimehr， Devaney, Bilenko, Young, & Tootell, 被 认为 与 物体 形状 和 类 别 的 编码 关 ( 如 ， Eger, 


2011) 以 及 空间 延伸 性 (Kravitz, Peng, & Baker, Ashburner, Haynes, Dolan, & Rees, 2008)， 近 来 人 
2011; Park, Brady, Greene, & Oliva, 2011) 等 特性 们 发 现 其 在 场景 加 工 过 程 中 也 承担 着 重要 作用 。 
的 编码 有 关 。 这 些 研 究 认为 PPA 就 像 大 脑 中 的 “ 空 Walther 等 人 (2009) 发 现在 此 过 程 中 PPA、RSC 和 
间 布 局 分 析 器 *”， 承 担 着 场景 空间 信息 表征 建构 LOC 在 协同 作用 下 完成 了 对 场景 信息 的 加 工 。 

的 工作 。 后 续 研 究 发 现 PPA 区 域 还 与 场景 中 物体 Harel, Kravitz 和 Baker (2013) 发 现 , RSC 和 PPA 同 
信息 的 加 工 有 关 , 包括 物体 大 小 (如 ，Cant & Xu, 时 对 场景 的 空间 布局 敏感 , 而 LOC 和 PPA 则 同时 
2012; Konkle & Oliva, 2012) 、 物 体 引 发 场景 联想 对 场景 中 的 物体 敏感 。 
的 难 易 (Mullally & Maguire，2011) 和 场景 分 类 那么 , 这 些 脑 区 究竟 是 怎样 在 场景 加 工 的 过 
(Dilks, Julian, Kubilius, Spelke, & Kanwisher, 2011; 程 中 协同 完成 任务 的 呢 ? PPA 在 空间 信息 和 物体 
Peelen, Fei-Fei, & Kastner, 2009; Walther, Caddigan, 属性 加 工 上 的 双重 作用 应 如 何 解释 呢 ” 为 了 探索 
Fei-Fei, & Beck, 2009) 等 。 这 些 发 现 表明 PPA 不 仅 这 种 协同 运作 的 具体 方式 Baldassano, Beck 和 
是 一 个 “空间 布局 分 析 器 ”， 而 且 对 场景 中 的 物体 Fei-Fei (2013) 采 用 功能 联结 分 析 (functional 


也 具有 强 的 敏感 性 。 connectivity analysis) 技 术 ， 发 现 PPA 区 域 的 前 部 
压 后 皮层 (retrosplenial cortex, RSC) 也 是 具有 与 RSC 区 域 反应 相关 性 很 大 ,而 PPA 区 域 的 后 部 
场景 反应 偏向 性 的 重要 脑 区 ， 并 与 视觉 系统 的 空 则 与 LOC 区 域 反 应 相关 性 很 大 , 证 明 PPA 是 由 前 


间 定 位 和 导航 能 力 有 关 (Epstein, Parker, & Feiler, 后 两 个 功能 不 一 致 的 部 分 组 成 : 前 部 与 场景 的 记 
2007; Marchette, Vass, Ryan, & Epstein, 2014; Vann, 忆 和 情境 加 工 有 关 ， 而 后 部 与 低 水 平 特征 和 物体 
Aggleton, & Maguire, 2009; Vass & Epstein, 2013)。 形状 的 加 工 有 关 。 近 期 一 项 研究 发 现 ， 视 觉 系统 
RSC 与 PPA 且 都 与 场景 的 空间 延伸 性 有 关 在 针对 不 同 空间 布局 、 纹 理 材 料 ， 以 及 具有 开放 
(Henderson, Zhu, & Larson, 2011), 但 PPA 能 够 分 或 封闭 、 自 然 或 人 工 属性 的 材料 完成 不 同 种 类 的 
辨 出 场景 中 细节 的 改变 ， 却 不 能 判断 视角 改变 前 判断 任务 时 ， PPA、RSC 和 OPA 区 域 的 激活 程度 
后 的 两 个 场景 是 否 是 同一 个 位 置 , 而 RSC 则 能 够 受到 任务 种 类 和 场景 属性 交互 作用 的 影响 ,证 明 
将 不 同 视 角 的 变化 与 不 同 场景 的 变化 区 别 开 。 视觉 系统 虽然 会 对 场景 的 多 种 信息 进行 提取 和 整 
PPA 与 RSC 的 这 种 功能 上 的 互补 帮助 视觉 系统 建 合 , 但 这 个 过 程 会 随 着 任务 目的 和 场景 特征 的 不 
立 起 完整 旦 细节 丰富 的 多 方位 场景 表征 (Park & 同 而 变化 (Lowe, Gallivan, Ferber, & Cant, 2016)。 


| 


Chun, 2009)。 这 样 的 结果 与 联结 加 工 理论 对 场景 加 工 的 解释 
不 同 于 PPA 和 RSC， 人 们 对 OPA 区 域 在 场景 一 致 ， 为 未 来 对 场景 加 工 机 制 的 探索 提供 了 可 行 


加 工 中 的 功能 知之 其 少 。Dilks 等 人 (2013) 认 为 方向 。 
OPA 可 能 是 最 先 获 得 感受 器 传人 的 场景 信息 的 综 上 可 知 ，PPA 的 前 部 与 RSC 主要 参与 场景 
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的 空间 信息 编码 , PPA 后 部 与 LOC 主要 参与 场景 
中 物体 的 加 工 ， 而 OPA 的 真正 功能 以 及 这 些 脑 区 
在 场景 加 工 中 的 协同 工作 方式 仍 不 清楚 。 目 前 有 
研究 认为 主旨 表征 是 场景 空间 信息 编码 不 可 缺少 
的 信息 (Siddiqui & Brown，2015)， 其 中 场景 的 快 
速 分 类 任务 也 与 这 些 脑 区 相关 (Ramkumar，Hansen， 
Pannasch, & Loschky，2016), 但 究竟 它们 在 场景 
主旨 加 工 中 起 到 哪些 具体 作用 ? 这 些 问题 的 答案 
仍 需要 进一步 的 探索 研究 。 


6 ”小结 与 展望 


本 文 对 真实 场景 主旨 加 工 的 影响 因素 、 相 关 
的 争议 性 问题 、 加 工 机 制 的 理论 解释 以 及 场景 主 
旨 加 工 的 神经 基础 等 方面 进行 评述 。 尽 管 该 领域 
的 相关 研究 已 经 取得 了 一 些 重要 性 的 成 果 , 但 这 
些 研究 成 果 中 仍然 存在 一 些 或 待 解决 重要 问题 。 

首先 , 目前 的 研究 结果 支持 场景 主旨 的 识别 
需要 全 局 特性 作为 诊断 性 信息 ， 而 颜色 、 空 间 频 
率 、 线 条 朝向 等 低 水 平 信息 对 主旨 的 加 工 也 具有 
一 定 影响 。 据 此 可 以 对 场景 主 则 的 加 工 进行 两 个 
方面 的 研究 : (1) 已 有 研究 表明 视觉 系统 对 真实 场 
景 的 信息 加 工具 有 一 定 程度 的 灵活 性 ， 这 种 灵活 
性 在 多 大 程度 上 影响 了 场景 早期 加 工 的 信息 提取 
仍 不 清楚 ， 因 此 可 通过 在 同一 实验 范式 中 操纵 任 
务 或 者 经 验 等 变量 来 研究 它们 对 信息 提取 的 影响 ， 
以 此 来 探讨 视觉 信息 的 前 馈 (feedforward) 和 反馈 
(feedback) 加 工 之 间 的 相互 关系 (Maguire & Howe, 
2016; Potter et al., 2014; 孙 雨 生 等 , 2017); (DAA 
研究 对 全 局 特征 的 种 类 表述 不 够 规范 ， 因 此 可 以 
进一步 探讨 是 否 存在 场景 信息 加 工 的 基本 单元 ， 
究竟 哪些 特征 (如 自然 性 、 开 放 性 、 粗 糙 度 等 ) 可 以 
作为 场景 信息 加 工 的 基本 单元 , 这 些 特征 对 于 不 
同类 型 的 场景 图 像 是 否 具 有 特异 性 ， 此 方向 的 研 
帘 有 利于 找到 更 好 的 计算 机 分 类 算法 ， 使 机 器 视 


诊断 性 信息 的 ， 而 场景 主 旧 加 工会 影响 注意 引导 
和 记忆 (Malcolm et al., 2016)。 但 场景 中 的 物体 是 
和 否 会 影响 ， 如 何 影响 场景 主旨 的 加 工 仍 不 清楚 。 
为 了 回答 该 问题 , 未 来 研究 可 以 从 以 下 两 个 方面 
展开 研究 : (1) 已 有 研究 表明 场景 与 物体 的 语义 一 
致 性 对 物体 的 加 工具 有 促进 作用 ,这 种 一 致 性 是 
否 能 够 促进 场景 主旨 的 加 工 以 及 这 种 一 致 性 判断 
在 场景 主旨 识别 过 程 中 是 否 为 必要 过 程 ; DOA 
研究 表明 场景 主旨 与 物体 加 工 存 在 交互 作用 ， 这 
种 交互 作用 是 否 暗示 场景 与 物体 加 工 并 不 是 平行 
过 程 而 是 相互 促进 、 相 互 制约 ， 如果 是 ,那么 这 种 
交互 作用 是 怎样 在 注意 的 调节 下 完成 的 。 

第 三 , 目前 的 研究 结果 在 场景 的 层级 加 工 优 
先 性 上 存在 矛盾 : 早期 研究 者 发 现 了 场景 分 类 基 
本 水 平 优势 ; 然而 后 来 的 研究 采用 不 同 的 实验 范 
式 和 方法 获得 了 上 级 水 平 优势 。 我 们 认为 这 种 看 
似 存在 矛盾 的 层级 加 工 优先 性 的 模式 可 能 并 不 那 
么 稳定 , 会 受到 一 些 因素 的 调节 ,未 来 研究 可 从 
以 下 几 个 方面 做 进一步 的 探讨 : (1) 近 期 已 有 研究 
探讨 了 场景 图 片 的 相似 性 对 层级 加 工 优先 性 的 影 
啊 (Banno & Saiki, 2015, Poncet & Fabre-Thorpe, 
2014); 后 续 研 究 可 以 探讨 其 他 调节 这 种 层级 加 
工 优先 性 的 边界 条 件 ， 如 场景 图 片 的 典型 性 等 。 
(2) 已 有 研究 表明 工作 记忆 内 容 能 够 增强 视 知觉 
表征 (如 ，Soto,，Wriglesworth,，Bahrami-Balani, & 
Humphreys, 2010); 后 续 人 研究 可 以 探讨 工作 记忆 
的 内 容 对 场景 层级 加 工 优先 性 的 调节 作用 。(3) 有 
人 研究 表明 奖赏 能 够 改变 知觉 (Failing & Theeuwes, 
2016), 那么 场景 中 包含 的 具有 生存 价值 /情绪 性 
意义 的 信息 是 否 也 会 影响 场景 主旨 加 工 的 层级 优 
先 性 也 是 一 个 值得 探讨 的 问题 ( 李 毕 琴 等 , 2015)。 
另外 , 还 有 研究 暗示 场景 主旨 的 加 工具 有 个 体 差 
异性 , 那么 个 体 差异 是 否 也 会 影响 场景 主旨 层级 
加 工 优先 性 值得 进一步 的 研究 。 对 这 类 问题 的 研 


觉 更 加 接近 人 类 的 视觉 系统 。(3) 场 景 图 像 中 全 局 
特征 的 加 工 与 群集 表征 (assembly representation) 
加 工 之 间 有 什么 样 的 关系 ,二 者 的 加 工 是 否 具 有 
共同 的 机 制 (Alvarez, 2011; Brady, Shafer-Skelton, 
& Alvarez, 2017; Cohen, Dennett, & Kanwisher, 
2016; De Cesarei, Loftus, Mastria, & Codispoti, 
2017)。 

其 次 ,就 场景 主旨 加 工 的 理论 解释 而 言 ， 我 
们 认为 一 般 情况 下 主旨 是 以 场景 的 全 局 特征 作为 


究 将 有 助 于 揭示 场景 主旨 加 工 的 时 间 进 程 。 
第 四 ， 目 前 的 研究 对 场景 主旨 的 加 工 或 分 类 
是 否 需 要 注意 资源 的 问题 尚未 有 定论 。 当 前 对 场 
景 主 旨 是 否 需要 注意 参与 的 问题 可 以 从 以 下 方向 
进行 研究 : (1) Groen 等 人 (2016) 发 现 除 了 任务 难 
E, 在 双 任 务 条 件 下 的 两 种 目标 刺激 在 空间 上 是 
否 发 生 重 大 可 能 会 影响 到 两 种 任务 在 注意 分 配 上 
是 否 存在 竞争 ， 这 一 假设 有 待 进一步 考证 ; (2) 
Kay, Weiner 和 Grill-Spector (2015) 在 一 项 fMRI 
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研究 中 使 用 人 脸 作为 刺激 材料 发 现 注 意 状 态 对 早 
期 视觉 皮层 的 激活 没有 影响 ,仅仅 影响 晚期 高 水 
平 类 别 选择 区 域 (high-level category selective area), 
表明 人 脸 刺 激 中 的 早期 低 水 平 信息 加 工 不 易 受 注 
意 资 源 多 少 的 影响 。 在 这 一 研究 的 启示 下 ， 可 分 
开 探 讨 场景 不 同 水 平 信息 加 工 与 注意 资源 的 关 
系 ， 即 是 否 场景 的 部 分 信息 需要 注意 参与 才能 完 
成 提取 和 加 工 ， 而 另 一 些 信息 的 加 工 则 不 需要 注 
意 参 与 。 

第 五 , 关于 场景 主旨 加 工 的 时 间 动 力 特性 的 

神经 基础 方面 , 目前 的 研究 还 相对 较为 薄弱 ， 结 
果 也 不 尽 相 同 ,还 需要 设计 巧妙 的 实验 ,， 利用 高 
时 间 分 辩 率 的 ERP 技术 来 明确 场景 主旨 加 工 的 时 
间 进 程 。 在 场景 主旨 加 工 的 特异 性 脑 区 方面 的 研 
究 较为 丰富 ,大 多 数 人 研究 主要 提 及 了 PPA, RSC, 
OPA 和 LOC 四 个 区 域 在 场景 主旨 加 工 中 的 作用 ， 
但 对 这 些 区 域 在 场景 主旨 加 工 过 程 中 是 如 何 协同 
作用 的 研究 相对 较 少 ,未 来 研究 可 以 考虑 利用 有 
功能 联结 分 析 技 术 探讨 这 些 区 域 的 协同 作用 ,为 
场景 知觉 加 工 建立 相应 的 脑 功 能 网 络 。 这 个 领域 
的 研究 对 于 智能 机 器 视觉 的 研制 和 深度 神经 网 络 
的 构建 具有 启示 意义 。 
到 目前 为 止 ,场景 主旨 加 工 的 研究 虽然 取得 
了 丰硕 的 成 果 , 但 还 存在 诸多 争议 性 的 问题 或 待 
解决 。 我 们 期 待 将 来 有 更 多 研究 者 加 入 到 该 领域 
的 研究 中 来 ， 将 行为 实验 、 眼 动 技术 、 计 算 建 模 
和 现代 化 脑 成 像 技术 等 多 种 方法 相 融 合 ， 对 场景 
主旨 加 工 进行 全 面 立 体 的 研究 ， 以 丰富 人 们 对 真 
实 场景 加 工 过 程 的 理解 。 
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Abstract: With a mere glimpse of a scene, observers can grasp a variety of perceptual and semantic 
information. This is referred to as scene gist. In recent years, scene gist processing has become an important 
topic in visual perception domain. Research on this theme can reveal the processing mechanisms for visual 
information and provide important implications for developing intelligent machine vision. The influencing 
factors, the controversial issues, and the neural basis of scene gist processing are reviewed. Some important 
issues, including the primary element of scene gist processing, the relevant theoretical explanations, the 
modulating factors of the hierarchical processing, the modulatory effect of attention, the timing dynamic 
characteristics and the construction of the brain function network, should be further explored. 
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